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摘 要 : 


[ 目的 /意义 ] 科 学 研究 (尤其 是 医学 研究 ) 充满 了 不 确定 性 ,识别 研究 中 的 矛盾 知识 主张 将 有 助 于 识别 “科学 分 
歧 / 不 一 致 的 科学 结论 ” ,推动 潜在 交 革 性 科学 研究 的 识别 和 相关 研究 的 完善 。[ 方 法 /过 程 ] 以 阿尔 英 海 默 病 为 
例 , 将 PubMed 文摘 数据 作为 数据 源 ,采用 SemRep 工具 进行 三 元 组 抽取 。 制 定 表 征 矛 盾 意 义 的 知识 主张 识别 规 
Jt] ,依据 不 确定 性 程度 高 低 对 来 源 语句 进行 划分 ,分 别 采 用 单 名 识别 和 跨 语句 识别 两 种 途径 ,识别 以 三 元 组 形式 
表示 的 、 具 有 矛盾 意义 的 医学 研究 知识 主张 。[ 结果 /结论 ] 从 来 源 于 PubMed 的 6 574 篇 医学 文摘 中 共计 识别 出 
49 组 (涉及 277 对 三 元 组 ) 矛 盾 知 识 主张 。 阿 尔 英 海 默 病 在 诊断 和 治疗 方面 的 研究 仍 存在 部 分 争议 和 了 矛盾 ,有 待 


和 为 知识 图 谱 可 信 度 计算 提供 参考 。 
词 : 知识 发 现 不 确定 性 矛盾 知识 “SPO 
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究 前 沿 发 现 提 供 新 思路 ,可 用 于 基于 知识 计量 的 知识 发 现 


阿尔 茨 海 默 病 


O“ IRENE” (uncertainty ) 一 词 最 早出 现在 由 英国 
善 铸 政 治 经 济 学 家 人 詹姆斯. 穆 勒 于 1835 年 发 表 的 
LuisReform 一 文中 ,指出 法 律 条 文 的 错误 表述 会 带 来 
战 儿 和 不 确定 性 。 在 量子 力学 中 ,A-B 效应 ( 阿 哈 罗 诺 
夫 定 玻 姆 效应 ) 意 味 着 微观 世界 本 身 具 有 不 确定 性 5 。 
微观 客体 的 内 在 不 确定 性 必然 决定 描述 量子 客体 的 知 
识 晤 有 不 确定 性 。 知 识 是 对 客体 或 客观 过 程 的 反映 ， 
因此 描述 客观 世界 运动 规律 的 科学 知识 具有 不 确定 
性 。 医 学 研究 所 依赖 的 所 有 临床 数据 (包括 诊断 结果 、 
患者 提供 的 病史 和 体检 结果 等 ) 往往 是 不 完整 的 ,都 具 
有 不 确定 性 。 有 研究 表明 ,生物 医学 领域 常用 数据 库 
PubMed 中 的 论文 摘要 中 2 11% 的 句子 使 用 了 模糊 修 
tris] | EU E eA ,具有 高 度 的 不 确定 性 。Cell 杂 
志 在 2021 年 的 首 刊 发 刊 词 中 指出 :人 们 对 于 科学 进程 
的 理解 不 是 直线 式 发 展 的 ,每 一 个 科学 结论 都 是 用 不 
确定 性 衡量 的 ,更 好 的 实验 否定 早期 的 假设 不 是 科学 
的 失败 ,而 是 一 种 成 功 ;一 个 好 的 科学 家 应 该 正确 面 对 
与 其 之 前 的 结论 或 假设 相 矛 盾 的 更 好 证 据 ”。 识 别 医 
学 研究 中 的 “科学 分 歧 / 不 一 致 的 科学 结论 "有 助 于 发 


T 


现 研 究 的 争议 或 矛盾 之 处 ,并 据 此 寻找 更 好 的 证 据 , 推 
动 医学 研究 在 争论 中 向 前 发 展 。 

阿尔 次 海 默 病 ( Alzheimer disease , AD) 是 痴呆 (de- 
mentia) 的 一 种 ,根据 阿尔 茨 海 默 病 国际 协会 ( Alzhei- 
mer' s Disease International, ADI) 网 站 数据 5 , 全球 目 
前 已 有 5 000 余 万 人 患 有 阿尔 芯 海 默 病 或 其 他 类 型 痴 
呆 症 ,预计 到 2050 年 这 个 数字 将 达到 1. 52 亿 。 根 据 
中 国 老年 医学 会 网 站 2019 年 数据 ,我 国有 1 000 万 
左右 的 阿尔 效 海 默 病 患者 ,是 全 球 阿尔 欧 海 默 病 ( AD) 
患者 数量 最 多 的 国家 ,预计 到 2050 年 患 病 人 数 将 超过 
4 000 万 。 笔 者 基于 不 确定 性 原理 和 前 人 关于 矛盾 / 冲 
突 谓 词 选取 的 研究 基础 ,制定 表征 矛盾 /冲突 意义 的 三 
元 组 的 识别 规则 ,以 阿尔 获 海 默 病 为 例 ,从 海量 医学 文 
本 中 抽取 出 以 三 元 组 形式 表示 的 .具有 了 矛盾 争议 的 诊断 
和 治疗 类 临床 知识 主张 ,以 期 识别 出 该 领域 内 可 能 具有 
突破 性 研究 倾向 的 知识 点 ,为 医学 领域 研究 前 沿 的 识别 
提供 新 的 方式 ,挖掘 潜在 的 新 的 诊断 和 治疗 方法 。 


2 矛盾 /冲突 知识 主张 识别 的 方法 与 工具 
2.1 “理论 基础 及 相关 研究 进展 


TE The structure of scientific revolutions ; 50th anniver- 
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sary edition "一 书 中 ,托马斯 . 库 恩 根据 范式 转移 程 
度 ,将 科学 研究 分 为 常规 科学 研究 和 变革 性 研究 :常规 
FAEERE EHE E" ,致力 于 求解 当前 的 某 一 知识 领 
域 的 谜 题 , 趋 于 发 现 那些 它 期 待 发 现 的 事情 ,是 一 个 不 
断 提 出 假设 推测 并 进行 验证 的 过 程 ;变革 性 研究 旨 在 
通过 不 断 地 发 现 新 现象 和 反常 现象 ( 即 * 矛 盾 / 冲 
R) ,并 尝试 解释 或 解决 这 类 反常 ,最 终 产生 出 新 的 
理论 。 这 两 类 研究 的 范式 转移 程度 与 不 确定 性 程度 的 
对 应 关系 如 图 1 所 示 。 常 规 科学 研究 对 应 着 验证 候 
设 推测 的 过 程 ,变革 性 研究 对 应 着 解决 争议 矛盾 的 过 
程 。 根 据 牛 津 词典 (第 二 版 ) 的 定义 ,矛盾 (contradic- 
tion) 是 指 存在 两 个 或 两 个 以 上 不 相 容 主张 来 描述 同一 
EK, C. M. Chen HIM. Song 认为 不 确定 性 科学 知 
识 直 要 是 指 处 于 假设 推测 或 争议 矛盾 状态 的 知识 , 科 
滨 的 进步 必须 处 理 有 争议 的 298 10 .不 完整 的 和 不 一 
致 的 信息 ""。 不 确定 性 原理 为 识别 科学 研究 过 程 中 
的 茸 盾 /冲突 提供 了 理论 基础 ,进而 为 识别 潜在 的 变革 


性 种 学 研究 提供 了 可 能 的 新 思路 。 


常规 科学 研究 


验证 < 一 假设 推测 — 未 验证 


不 确定 性 程度 高 
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=j 图 1 


范式 转移 程度 与 知识 不 确定 性 程度 的 关系 


关于 知识 主张 (knowledge claims) , M. W. McElroy 
在 《新 知识 管理 :复杂 性 、 学 习 和 可 持续 创新 》 一 书 中 
秆 其 定义 为 “关于 何 种 潜在 行为 可 能 导致 预期 结果 的 
猜想 .断言 ,论证 或 理论 , 旨 在 缩小 当前 状态 和 目标 状 
AEAEE”, K. Peters 等 ”指出 知识 主张 的 类 
型 多 样 ,包括 理论 模型 .声明 方法 和 设计 。 一 方面 ， 
知识 主张 涉及 如 何 执行 任务 或 改变 事物 ; 另 一 方面 , 知 
识 主张 可 能 基于 其 他 知识 主张 ,是 关于 事物 现在 和 将 
来 发 挥 作用 或 运行 的 方式 。 科 学 研究 中 的 知识 主张 是 
指 研究 人 员 想 要 呈现 给 读者 的 最 重要 的 内 容 , 可 以 从 
研究 发 现 或 研究 结果 中 理解 出 的 总 体 结论 或 结果 , 具 
有 相反 的 断言 值 (assertion values) 的 知识 主张 被 认为 
是 潜在 的 矛盾 知识 主张 。 综 合 上 述 定义 ,本 研究 中 
的 “矛盾 知识 主张 "是 指 从 科学 人 研究 的 结论 或 结果 中 
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获取 到 的 具有 相反 蕴涵 的 猜想 .理论 .模型 ,声明 方法 
和 设计 。 

矛盾 /冲突 的 产生 可 分 为 语法 层面 的 冲突 和 语义 
层面 的 冲突 ,语法 层面 的 冲突 主要 由 各 类 语言 结构 导 
致 ,如 反义词 .否定 (包括 直接 否定 和 间接 否定 ) .数字 
或 时 间 不 匹配 .对 事实 真实 程度 的 隐 含 假定 (包括 使 役 
动词 . 隐 含 动词 和 非 使 役 动 词 ) .情态 表达 (包括 可 能 
性 情态 动词 和 必要 性 情态 动词 ) .结构 (包括 词汇 结构 
和 句法 结构 ) 背景 知识 等 ” ;语义 层面 的 矛盾 冲突 主 
要 来 源 于 释义 和 文本 蕴涵 的 差异 ”。 相 应 的 ,矛盾 / 
冲突 识别 的 方法 可 以 分 为 两 类 :对 于 语法 层面 的 矛盾 
冲突 ,需要 对 涉及 到 的 否定 ,对比 和 反义词 等 语言 特征 
进行 分 析 ; 对 于 语义 层面 的 矛盾 冲突 , 则 可 以 在 去 除 否 
定 命题 后 衡量 文本 间 的 文本 列 涵 是 否 成 立 , 如 果 成 立 
则 说 明 该 文本 对 是 冲突 的 "9 “科学 分 歧 / 不 一 致 的 
科学 结论 ”是 指 两 个 知识 主张 涉及 同一 事物 但 又 不 可 
能 同时 为 真 时 ,被 认为 是 互相 矛盾 的 。 围 绕 着 “科学 分 
歧 / 不 一 致 的 科学 结论 ”这 一 类 型 不 确定 知识 的 测度 ， 
部 分 学 者 从 引用 语句 切入 ,分 析 科 研 人 员 对 科学 主张 
和 论断 的 不 确定 性 程度 评价 。H.， Kilicoglu 等 根据 
引用 情感 与 被 引 临 床 研究 结论 的 一 致 程度 ,对 临床 医 
学 研究 文献 的 引用 语句 进行 情感 分 析 , 负 向 情感 表示 
与 被 引 临 床 研究 结论 不 一 致 ;D，Murray 等 ”构建 了 
表征 科学 分 歧 的 线索 词 (contradict、conflict) 和 过 滤 词 
(studies „results ) ,根据 线索 词 和 过 滤 词 测度 引用 语句 
中 的 科学 分 歧 。 基 于 引用 语句 的 分 析 , 是 基于 概念 共 
现 的 相关 关系 的 探测 ,无 法 识别 出 结构 化 的 .表示 因 果 
关系 的 不 一 致 结论 。 此 外 ,也 有 学 者 从 文本 内 容 分 析 
和 知识 单元 (knowledge unit) 角度 切入 开展 矛盾 性 医学 
知识 识别 :对 于 语句 内 识别 ,依据 语句 中 是 否 包含 表示 
矛盾 /冲突 的 提示 词 ( 如 controversial , contradictory , con- 
flicting 等 ) 来 识别 语句 内 的 带 有 了 矛盾 /冲突 表征 的 三 元 
组 (主语 -谓词 -宾语 ,是 细 粒 度 表征 知识 对 象 及 其 关 
系 的 知识 单元 ) ;对 于 跨 语 名 识别 ,主要 是 基于 三 元 组 
rp" SEX RH Fe] .谓语 相反 ”规则 识别 矛盾 性 医学 知识 ， 
不 同 的 是 研究 人 员 对 谓词 的 选取 和 分 类 。A. Alam- 
ri 将 谓词 分 为 主动 /导致 类 (如 AUGMENTS , CAUS- 
ES) ,被动 /抑制 类 (如 DISRUPTS , PREVENTS ) 和 其 他 
类 (如 ADMINISTERED_TO .OCCURS_IN ) ;G. Rosemb- 
lat 等 ”将 谓词 分 为 有 因果 意义 的 4 对 相反 谓词 对 和 
无 因果 意义 的 4 对 相反 谓词 对 ;J. M. G. Pinto 等 ” 则 
选取 了 7 种 谓词 来 识别 矛盾 性 知识 和 多 样 性 知识 ;X. 
Y. Li 等 ”将 谓词 分 为 激励 类 (excitatoryz ) 和 抑制 类 
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MEK, pp. 不 确定 性 环境 下 的 矛盾 知识 主张 识别 研究 []]. 图 书 情报 工作 ,2021 ,65(20):123 - 134. 


( inhibitory ) 并 设 定 了 识别 规则 来 发 现 予 盾 / 冲 突 类 知 
识 主 张 (knowledge claims) 和 多 样 性 知识 主张 。 列 出 表 
征 矛 盾 / 冲 突 的 谓词 对 的 方式 ,可 以 清晰 地 理解 识别 出 
的 三 元 组 的 因果 关系 ,但 识别 出 的 知识 主张 数量 会 受 
限于 识别 规则 的 数量 ;将 谓词 划分 为 激励 类 和 抑制 类 
两 个 相互 矛盾 /冲突 的 群 组 的 方式 ,可 以 识别 出 更 多 的 
矛盾 /冲突 知识 主张 ,但 不 能 清晰 地 获取 三 元 组 中 的 因 
果 关 系 。 
综合 上 述 研究 现状 ,笔者 认为 不 同 的 知识 主张 其 

所 表达 的 知识 的 不 确定 性 程度 是 不 一 样 的 , 需 先 依据 
源 语句 中 是 否 包 含 表 征 不 确定 性 程度 的 提示 词 进行 不 
确定 性 程度 的 区 分 ,进而 再 以 从 源 语句 中 抽取 出 的 三 
元 组 为 判别 对 象 ,通过 抽取 出 的 谓词 确定 实体 之 间 的 
关系 ,依据 规则 判断 两 对 三 元 组 是 否 是 矛盾 /冲突 的 ， 
将 个 析 角 度 从 相关 关系 转向 因果 关系 ,更 便于 解释 巴 
导 4 钟 突 的 由 来 。 
三 元 组 抽取 工具 
之 常用 的 三 元 组 抽取 工具 有 开放 信息 抽取 工具 
( Qpen Information. Extraction , OpenIE ) [2] oGoldfira 7 .. 
Sfp "等 ,分 别 面向 开放 信息 .专利 和 生物 医学 领 

笔者 采用 SemRep 工具 从 生物 医学 文本 中 抽取 语 

CÈR ,SemRep 抽取 的 三 元 组 主语 和 宾语 都 是 UMLS 
超 绕 儿 词 表 ( metathesaurus ) 中 带 有 特定 语义 类 型 的 概 
念 3 谓词 来 源 于 扩展 后 的 UMLS 语义 网 络 关系 类 型 。 
ep 既 可 以 从 语法 层面 对 涉及 到 的 否定、 对 比 和 反 
义 词 等 语言 特征 进行 分 析 , 也 能 从 语义 层面 依据 识别 
出 草 语 义 关系 来 揭示 文本 殖 涵 。SemRep 工具 能 够 识 
别 贷 的 语义 关系 类 型 主要 有 :临床 相关 (如 treats diag- 
noses .process_of) ,分 子 相 互 作 用 (如 interacts, with , in- 
hibits ,stimulates) ,疾病 病因 学 (如 associated. with , cau- 
ses , predisposes ) , 药物 基因 组 学 (如 affects , augments , 
disrupts ) ,静态 关系 (isa , part. of , location, of) 等 ,能够 满 
足 本 研究 对 语义 谓词 类 型 的 需要 。SemRep 针对 不 同 
类 型 的 语义 关系 的 识别 精确 度 较 高 ,针对 特定 谓词 领 


进行 三 元 组 抽取 ,所 用 工具 版 本 为 1.8 版 本 ,输出 结 
果 为 txt 格式 。 
2.3 矛盾 /冲突 知识 主张 识别 方法 与 规则 

矛盾 /冲突 知识 主张 识别 的 总 体 识 别 方法 路 径 如 
2 所 示 。 在 进行 单 句 和 有 跨 语句 识别 前 ,需要 对 源 语 
句 的 不 确定 性 程度 进行 判定 ,如 果 源 语句 中 含有 
" may" " could" “might ”等 表示 高 不 确定 性 程度 的 提示 
词 , 则 将 其 划 入 到 不 确定 性 程度 较 高 的 知识 主张 识别 
过 程 中 ,反之 则 划 入 不 确定 性 程度 较 低 的 知识 主张 识 


别 过 程 。 


知识 主张 
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不 确定 性 程度 较 不 确定 性 程度 较 
高 的 知识 主张 低 的 知识 主张 


单 名 识别 跨 语 名 识别 


矛盾 知识 主张 
图 2 矛盾 知识 主张 识别 方法 路 径 


矛盾 /冲突 知识 主张 识别 主要 分 为 单 句 识别 和 跨 
语句 识别 两 类 ” 。 

对 于 单 句 识别 ,可 以 通过 查找 句子 中 是 否 包含 
" controversial” “ debatable” “ contentious” " contradictory " 
" contrary" “ opposing” FI ^ conflicting” 4& HH t H5) HE ZR ia] 
来 判定 该 句子 是 否 为 列 涵 矛盾 / 神 突 的 语句 ,然后 提取 
句子 中 的 三 元 组 。 

笔者 将 三 元 组 的 表示 形式 定义 为 Tin = (C4, 
Rin, C2) ,从 句子 S, 中 抽取 获得 ,Cil 为 三 元 组 Tin 的 
主语 ,Ci2 为 三 元 组 Tin 的 宾语 ,Rin 为 三 元 组 Tin 的 谓 


域 ( 如 药物 基因 组 学 ) 和 特定 语言 结构 (如 比较 谓词 ) 
的 准确 率 分 别 达到 了 76% ”和 96% ”, 在 基于 标准 
的 基准 语料库 CDR ( chemical-disease relation ) 的 句子 
层级 的 评估 中 ,将 谓词 限定 在 “causes、 affects , aug- 


ments , stimulates , predisposes 和 associated_with” 等 带 


有 因果 关系 的 语义 谓词 ,抽取 准确 率 达 到 9096 7, 
能 够 满足 本 研究 对 抽取 出 的 三 元 组 的 准确 性 的 需 
要 。SemRep 提供 了 网 页 交互 .批量 处 理 、API 远程 调 
用 和 本 地 安装 4 种 使 用 方式 ,笔者 采用 批量 处 理 方式 


词 。 定 义 提示 词 集合 M= |W,, W,,…,W,|,N 为 构 
成 Si 的 所 有 单词 的 集合 | Nl1, Ni2,…,Nin| ,定义 U 
为 蕴涵 矛盾 /冲突 的 三 元 组 集合 。 单 名 识别 的 规则 如 
下 : 

Input S, 

It NOM 
任 一 提示 词 

Then Tn Z(Cj1, Rn, C2) e U // 则 从 S; 中 抽 


// 输 入 语句 5; 
// WR S, 中 含有 集合 M 中 的 


T 
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a AA, 1 
C nina 


取出 的 三 元 组 Tin 为 草 涵 矛盾 /冲突 的 三 元 组 
对 于 路 语句 识别 ,可 以 根据 以 下 规则 进行 判定 
从 科学 主张 中 抽取 两 个 及 以 上 的 “主语 - 谓词 - 
语 (Subject-Predicate-Object,SPO)” 三 元 组 ,这 些 三 
组 有 着 共同 的 主语 和 宾语 ,但 谓词 的 语义 类 型 相反 。 
定义 另 一 对 三 元 组 Tim = (C1, Rim, C2) ,从 句子 S; 
中 抽取 获得 ,定义 矛盾 语义 谓词 对 集合 P= (RU, 
Ri1),(R2, R2)…,(Rin, Rim)| ,定义 V 为 互相 矛 
盾 / 冲 突 的 三 元 组 对 集合 , 跨 语 句 识 别 规则 如 下 : 
// 输 入 三 元 组 T,n 和 Tm 
HCl= C1,C2- C2,(Rin, Rm) eP // 如 果 
三 元 组 了 和 TT; 中 的 主语 和 宾语 相同 , 旦 谓 词 对 来 自 于 
集合 P 中 的 任 一 元 素 
一 Then(Tin,Tim) eV — //WIZHIA S, 和 Si 中 抽 
取 淋 的 三 元 组 Tin 和 Tim 互 为 矛盾 /冲突 三 元 组 对 
己 上 = 根据 需要 ,笔者 从 SemRep 工具 能 够 识别 出 的 众多 


T 
其 
pi" 


Input T, n, Tm 


类 型 的 语义 关系 中 选取 了 与 临床 诊断 和 治疗 密切 相关 


jm 、 EH 2 
的 语义 关系 类 型 ,主要 谓词 包括 :treats、 causes、 pre- 


] 


predisposes , augments , disrupts , stimulates , inhibits , 


( Yi 
终 形 成 的 相反 谓词 对 如 表 1 所 示 , 包 括 涉及 因果 关系 
乓 谓词 对 和 缺少 因果 关系 的 谓词 对 。 如 果 两 对 三 元 组 
含有 相同 的 主语 和 宾语 , 且 谓词 为 表 1 中 所 列 出 的 表 


qu R2 


表 1 研究 所 采用 的 表示 矛盾 关系 语义 谓词 对 


涉及 因果 关系 的 谓词 对 


缺少 因果 关系 的 谓词 对 


treats VS causes treats vs neg_ treats 

treats vs predisposes causes vs neg causes 

prevents VS causes predisposes vs neg predisposes 

prevents vs predisposes prevents vs neg prevents 

augments vs disrupts augments vs neg augments 

stimulates vs inhibits stimulates vs neg stimulates 
disrupts vs neg disrupts 
inhibits vs neg inhibits 


具体 而 言 ,对 于 单 句 识别 ,提示 词 集合 M = fcon- 
troversial , debatable , contentious, contradictory , contrary , 
opposing , conflicting] 。 对 于 跨 语 句 识 别 , 予 盾 语义 谓词 
对 集合 P = |( treats, causes), (treats, predisposes ) , 
(prevents, causes), ( prevents, predisposes ), ( aug- 
ments, disrupts ) , (stimulates, inhibits), (treats, neg_ 
treats) , (causes, neg causes) , ( predisposes, neg_predis- 
poses), (prevents, neg prevents), (augments, neg aug- 
ments), (stimulates, neg stimulates) , ( disrupts, neg - 
disrupts) , (inhibits, neg inhibits) | 。 

利用 上 述 规则 识别 出 的 一 对 矛盾 知识 主张 例句 如 
表 2 所 示 , 其 中 语句 31895707. ab. 1” 和 语句 
32476013. ti. 1'”1 因 相反 的 谓词 对 “ predisposes” FI“ neg 
predisposes” M RAX JA HS] ANR ESK , BI“ Joc A6 1 
制剂 (proton pump inhibitors ) " Z/ A zz ^ Jg ( de- 
mentia ) " [fj JUS o 


一 对 矛盾 的 知识 主张 示例 


€) 源 语句 


主语 谓词 宾语 


31895707. ab. 1 Introduction; Long-term use of proton pump inhibitors ( PPIs) has been associat- 


proton pump inhibitors predisposes dementia 


ed with a wide variety of potentially serious adverse effects including a possible increased risk of 


dementia. 


32476013. ti. 1 Proton pump inhibitors do not increase the risk of dementia; a systematic review 


and meta-analysis of prospective studies. 


3 矛盾 /冲突 知识 主张 识别 结果 


3.1 数据 获取 与 处 理 

科学 文献 是 科学 知识 的 主要 载体 ,可 理解 为 针对 
科学 问题 .提供 证 据 支 持 的 知识 主张 记录 。PubMed 
( https :// pubmed. ncbi. nlm. nih. gov/) 是 一 个 提供 生物 
医学 方面 的 科学 文献 引文 及 摘要 信息 的 数据 库 ,由 美 
国 国立 医学 图 书馆 (National Library of Medicine, NLM) 
开发 ,目前 包含 了 来 自 MEDLINE、 生 命 科学 期 刊 和 在 
线 书 籍 的 3 200 多 万 条 生物 医学 文献 引文 和 摘要 信 
息 ,是 医学 领域 科研 人 员 频 繁 使 用 的 文献 检索 平台 。 


neg_predisposes 


因此 ,笔者 将 PubMed 作为 矛盾 知识 主张 识别 的 数据 
来 源 。 对 于 不 同类 型 的 科技 文献 ,其 所 提供 的 证 据 / 主 
张 的 可 信 度 是 不 同 的 '” 。 在 现实 世界 中 ,与 案例 研究 
相 比 ,随机 对 照 实验 (Randomized Controlled Trial, 
RCT) 和 系统 综述 类 的 研究 具有 更 高 的 临床 证 据 水 
平 " ,能 够 从 支撑 语句 中 抽取 出 具有 更 高 可 信和 度 和 准 
确 度 的 矛盾 /冲突 发 现 。 因 此 ,笔者 以 “Alzheimer”s 
Disease" 为 主题 ,将 文献 类 型 限定 为 具有 较 高 可 信 度 和 
准确 度 的 临床 指南 、 元 分 析 文 草 、 临 床 试验 类 文章 、 对 
比分 析 文 章 等 ,检索 近 10 年 内 发 表 的 英文 文章 ,检索 
时 间 为 2021 年 1 月 26 日 ,扩展 后 的 数据 检索 式 为 : 


二 
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进 京 ， 黄 奇 .不 确定 性 环境 下 的 矛盾 知识 主张 识别 研究 [J]. 图 书 情报 工作 ,2021 ,65(20) :123 - 134. 


(“alzheimer disease" [ MeSH Terms | OR ( * alzhei- 
mer" [ All Fields | AND “ disease" [ All Fields ]) OR 
“alzheimer disease" [ All Fields] OR (“alzheimer s" [ All 
Fields] AND “ disease" [ All Fields ]) OR “alzheimer s 
disease" [ All Fields ]) AND (( y. IO[ Filter]) AND 
( clinicalstudy[ Filter] OR clinicaltrial [ Filter] OR clini- 
caltrialphasei[ Filter] OR clinicaltrialphaseii [ Filter] OR 
clinicaltrialphaseiii [ Filter | OR clinicaltrialphaseiv [ Fil- 
ter] OR comparativestudy [ Filter] OR controlledclinical- 
trial[ Filter] OR guideline[ Filter] OR meta-analysis| Fil- 
ter] OR multicenterstudy [ Filter] OR practiceguideline 
[ Filter] OR pragmaticclinicaltrial [ Filter] OR random- 
izedcontrolledtrial[ Filter] OR systematicreview [ Filter | ) 
ANB, ( english| Filter ] ) ) 

二 根据 上 述 检索 式 ,笔者 从 PubMed 中 共 检 索 到 近 
10 4E ZI 6 574 篇 与 “Alzheimer s Disease" 主题 相 


关 的 文章 ,将 文章 摘要 信息 ( 含 标题 .PMID 号 ) 导 入 
SemRep 工具 ,经 过 分 词 ,词汇 /句法 分 析 、 短 语 映 射 . 语 
义 谓 词 归 一 化 、 概 念 语义 类 型 约束 等 步骤 后 ,共计 得 到 
45 674 对 三 元 组 ,涉及 76 635 条 句子 。 根 据 需要 ,笔者 
依据 句子 中 是 否 含有 “may”“ could" " might” 等 表示 高 
不 确定 性 程度 的 提示 词 ” ,将 76 635 条 句子 划分 为 两 
类 :一 类 为 不 确定 性 程度 较 高 的 句子 (含有 “may” 
“could” " might" 等 提示 词 ) , 另 一 类 为 不 确定 性 程度 较 
IRIRE CE “may” “could” “might” 等 提示 词 ) ,分 别 
按照 2.3 中 的 规则 进行 矛盾 /冲突 知识 主张 的 单 句 识 
别 和 器 语 名 识别 ,具体 实验 流程 及 结果 如 图 3 所 示 
在 去 除 不 能 从 中 抽取 出 三 元 组 的 源 语句 之 后 ,最 终 纳 
人 分 析 的 源 语句 及 三 元 组 数量 如 表 3 所 示 。 在 根据 规 
则 识别 出 矛盾 /冲突 三 元 组 对 之 后 ,由 专家 对 抽取 结果 
进行 判读 并 得 到 最 终结 果 。 


o 


以 “Alzheimers Disease” 为 主题 ， 从 PubMed 中 检索 到 6 547 篇 
文摘 (2011-2-21) 


- Y 
"T 利用 SemRep 工 具 ， 得 到 76 635 条 源 语句 及 45 674 对 三 元 组 
- I 
Co y Y 
N GU "may" "could" "might" 891578 5]3 774 条 FA "may" "could" “might” 的 源 语句 72 8612& 
I 
e 有 
! {去 除 不 能 从 中 抽取 出 三 元 组 的 源 语句 
RO RECS DÀ ] MOVED er 
Y Y 
1702 条 源 语 名 及 2 890 对 三 元 组 | 23 394 条 源 语 句 及 42 775 对 三 元 组 


跨 语 句 识别 


chinaXiv 


As 冲突 = 元 
it 矛盾 /冲突 三 元 \ 


ot 


“controversial”™ debatable™‘contentious” 


跨 语句 识别 


是 否 含 有 以 下 提示 词 : N/C TA 
Vei 矛盾 /冲突 三 元 , \ 


x "contradictory "contrary "opposing" 和 / x 组 对 识别 规则 i x "contradictory "contrary "opposing" fi s 组 对 识别 规则 
k antiena E EN M. 2 "conflicting" 了 2s E 
SENE SX RENT DOOR TEN we Y 
3 条 源 语句 及 5 对 三 元 组 3 组 知识 主张 及 13 对 76 条 源 语句 及 125 对 三 元 组 87 组 知识 主张 及 807 对 
三 元 组 三 元 组 
Re | E ENESE T ERIRE RIERA TE VEIE EEEE A LOE VE EER 
H 删 去 与 “Alzheimers Disease” 的 诊断 和 治疗 内 容 不 相关 的 三 元 组 ， 并 经 专家 评判 
UDANE i T ESERE E, EREB, TT AA 
E MS ne 表示 矛盾 冲突 的 1 组 知识 x €— 表示 矛盾 冲突 的 36 组 知识 
表示 矛盾 冲突 的 5 对 三 元 组 k 突 的 10 对 三 元 
a m 主张 及 3 对 三 元 组 表示 开店 冲突 的 10 对 三 元 组 | | 主张 及 259 对 三 元 组 


图 3 了 矛盾 /冲突 主张 识别 实验 流程 及 结果 


表 3 实验 数据 的 基本 描述 性 统计 (单位 /条 ) 
数据 类 型 源 语句 数量 三 元 组 数量 
初始 数据 76 635 45 674 
不 确定 性 较 高 的 知识 主张 1 702 2 890 
不 确定 性 较 低 的 知识 主张 25 394 42 775 


3.2 不 确定 性 程度 较 高 的 矛盾 /冲突 知识 主张 识别 
根据 句子 中 是 否 含有 “may”“ could”“ might” 等 提 
示 词 ,笔者 从 76 635 条 句子 中 筛选 出 3 774 条 符合 条 


件 的 句子 ,得 到 来 源 于 1 702 条 有 效 语句 (有 的 语句 虽 
含有 表示 高 不 确定 性 的 词语 ,但 并 不 能 从 中 抽取 出 三 
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和 | 


元 组 ) 的 2 890 对 三 元 组 。 以 下 将 从 单 句 识别 和 跨 语 
句 识 别 分 别 进行 分 析 。 
3.2.1 不 确定 性 程度 较 高 的 矛盾 /冲突 知识 主张 单 句 
识别 

根据 2.3 中 所 设 定 的 识别 规则 ,首先 查找 1702 条 
句子 中 是 否 包 含 以 下 提示 词 :“ controversial” “ debata- 


€ 


ble" “ contentious " “ contradictory” “ contrary” “ opposing " 


和 “conflicting”, 根 据 这 些 提示 词 来 判定 该 句子 是 否 为 
斑 涵 矛盾 /冲突 的 语句 ,然后 再 提取 人 句子 中 的 三 元 组 。 
经 过 筛选 和 专家 判断 ,共计 得 到 来 源 于 3 条 语句 的 5 
对 三 元 组 ( 见 表 4) 。 例 如 ,从 语句 30098211. ab.15 中 
可 以 看 出 , 明 茶 二 氮 卓 类 药物 ( benzodiazepines ) 与 痴呆 
( dementia) 的 关系 是 存疑 的 , 需 进一步 验证 。 


表 4 单 名 内 不 确定 性 程度 较 高 的 矛盾 /冲突 知识 主张 识别 结果 


出 版 时 间 源 语句 


三 元 组 不 确定 词 ”矛盾 /冲突 词 


27845333. ab. 9 However, contrary to observational findings, coffee 
2016.11 may not have beneficial effects on T2DM, depression or Alzheimer’ s 


disease. 


28349979. ab. 1 Background; Androgen deprivation therapy ( ADT) to 
2017.09 treat prostate cancer may be associated with an increased risk of demen- 


tia, but existing studies have shown conflicting results. 


30098211. ab. 1 Study objective; The use of benzodiazepines and the 
development of dementia is controversial, with studies indicating that 
benzodiazepines could be either a protective factor or a risk factor for de- 


mentia, or no association may exist be. 


coffee-neg treats- Alzheimer! s Disease; coffee 


-neg ítreats-depressive disorder; coffee -neg _ 


i . . . may contrary 
treats-diabetes mellitus, non-insulin-depend- 
ent 
androgen therapy-freats-malignant neoplasm of x 
may conflicting 
prostate 
benzodiazepines-predisposes-dementia may controversial 


3O 不 确定 性 程度 较 高 的 矛盾 /冲突 知识 主张 跨 语 
IRESI 

vd 3.2.1 中 识别 出 的 5 对 三 元 组 后 ,根据 2.3 
喇 肾 设 定 的 规则 一 “主语 .宾语 相同 ,谓词 语义 类 型 


N 
p 


组 ,经 过 专家 评判 ,最 终 保留 一 组 ( 见 表 5)。 语 
1647938. ab. 3” 指出 , 脑 源 性 神经 营养 因子 


( Brain-Derived Neurotrophic Factor, BDNF ) 有 可 能 
(may) 会 促进 AD 的 发 展 (Brain-Derived Neurotrophic 
Factor-predisposes-Alzheimer' s Disease ) , 而 31518516. 
ab. 87^ Jj di BNDF 可 能 不 适合 (may not) 作为 诊断 
AD 的 最 佳 生物 标记 物 , 即 与 AD 的 关系 不 显著 (Brain- 
Derived Neurotrophic Factor-neg predisposes-Alzheimer' s 


Disease) ,这 两 对 三 元 组 的 知识 主张 是 存在 争议 的 。 


A5 跨 语 句 不 确定 性 程度 较 高 的 矛盾 /冲突 知识 主张 识别 结果 


源 语句 


矛盾 /冲突 三 元 组 


21647938. ab. 3 Dysregulation of brain-derived neurotrophic factor ( BDNF) has been implicated 


2011.06 in deficits of long-term potentiation and cognition and may contribute to the development of 


Alzheimer’ s disease ( AD). 


Brain-Derived Neurotrophic | Factor-predispo- 


ses-Alzheimer' s Disease 


31518516. ab. 8 However, the ROC curve analysis revealed that the peripheral BDNF levels may 


not be an optimal biomarker potentially for AD and MCI diagnosis with a lower AUC ( AD; 0. Brain-Derived Neurotrophic Factor-meg _ pre- 


2019. 09 
707 ; MCI; 0.573) , less sensitivity ( AD; 66. 6796 ; MCI; 50. 0096 ) and poor specificity (AD: — disposes-Alzheimer' s Disease 
93. 3396 ; MCI; 83.3396 ). 
31518516. ab. 9 These results suggested that AD or MCI is accompanied by reduction of peripher- A : : 1 
u . . ` . f Brain-Derived Neurotrophic Factor-neg_predis- 
2019. 09 al BDNF, but the levels of circulating BDNF may not be suitable as a diagnostic marker for AD 


and MCI. 


3.3 不 确定 性 程度 较 低 的 矛盾 /冲突 知识 主张 识别 

除去 3.2 中 不 确定 性 程度 较 高 的 3 774 条 句子 ,不 
含有 “may”“ could”“ might” 等 提示 词 的 语句 共有 
72 861 条 。 经 过 整理 ,去 除 不 能 从 中 识别 出 三 元 组 的 
语句 ,共计 得 到 来 源 于 25 394 条 有 效 语句 的 42 775 对 
三 元 组 。 以 下 将 从 单 句 识别 和 跨 语 句 识别 分 别 进行 
分 析 。 


poses-Alzheimer’ s Disease 


3.3.1 不 确定 性 程度 较 低 的 矛盾 /冲突 知识 主张 单 名 
识别 

采用 3.2.1 中 的 筛选 方式 ,首先 查找 25 394 条 名 
子 中 是 否 包 含 以 下 提示 词 :“ controversial”“ debatable” 


LE 


一 


' contradictory " " contrary " " opposing " ”和 
“conflicting”, 根 据 这 些 提示 词 来 判定 该 句子 是 否 为 表 
示 了 矛盾/ 冲突 的 语句 ,然后 再 提取 句子 中 的 三 元 组 。 经 


e . 3! 
contentious 
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过 初次 筛选 ,得 到 76 条 语句 含有 上 述 提示 词 ,从 中 抽 
取出 125 对 三 元 组 。 经 过 二 次 筛选 ,共计 得 到 与 AD 的 
诊断 和 治疗 相关 的 来 源 于 12 条 语句 的 13 对 三 元 组 。 
经 过 专家 判读 ,最 终 确定 来 源 于 9 条 语句 的 10 对 了 矛 
盾 / 冲 突 三 元 组 ( 见 表 6)。 例 如 , 现 有 的 研究 指出 , 抗 
氧化 剂 (antioxidants) 在 AD 的 预防 方面 的 作用 ,血管 内 
皮 生 长 因子 (vascular endothelial growth factor, VEGF) 
基因 是 否 是 AD 的 诱发 因素 ,补充 剂 (supplementation ) 


是 否 可 以 预防 AD ,都 是 存在 争议 的 。 组 织 蛋 白 酶 D 基 
(Cathepsin D , CTSD) , 4H 2& f% ( aluminum ) , 4 i FH 
E — B li Hg A ( Hydroxymethylglutaryl-CoA, HMG- 
CoA) 还 原 酶 抑制 剂 ( reductase inhibitors ) 乙醇 (etha- 
nol) 等 对 AD 诱发 作用 的 研究 是 存在 矛盾 的 ,银杏 叶 提 
取 物 EGb761 、 美 金刚 (memantine) 对 AD 的 治疗 作用 的 
研究 也 是 存在 矛盾 的 。 


表 6 


单 句 内 不 确定 性 程度 较 低 的 矛盾 /冲突 知识 主张 识别 结果 


出 版 时 间 源 语 句 三 元 组 矛盾 /冲突 词 
2011.06 20597865. ab. 2 Polymorphism at position 224, C224T, on exon 2 of cathepsin D gene Cathepsin D-predisposes-Alzhei- contrary 


(CTSD) has been associated with an increased risk for Alzheimer' s disease ( AD) by some 
investigators, but there have been contrary findings by others. 
22543848. ab. 1 In view of the vital role of oxidative stress in the pathogenesis of Alzheimer’ s 


disease ( AD) , the potential of antioxidant supplements to prevent AD have gained much inter- 
est, while there are conflicting results on this topic in recent years. 

23370341. ab. 1 There were conflicting results about whether promoter polymorphisms ( — 
2578C/A, —1154G/A) of vascular endothelial growth factor ( VEGF) gene is a risk factor of 
Alzheimer' s disease ( AD). 

25114079. ab. 1 Background; Research into Ginkgo biloba has been ongoing for many years, 
while the benefit and adverse effects of Ginkgo biloba extract EGb761 for cognitive impairment 


and dementia has been discussed controversially. 


25899425. ab. 1 The role of memantine as a treatment for Alzheimer' s disease ( AD) has been 


controversial. 
26098935. ab. 1 Background; Exposure to aluminum remains a controversial risk factor for 
Alzheimer' s disease. 


30045255. ab. 1 Previous studies have indicated that statins use is associated with risk of de- 


mentia, but presented controversial results. 


32021202. ab. 2 The consumption of alcohol is a controversially discussed risk factor for de- 


mentia. 


33395056. ab. 1 Background ; Prevention of Alzheimer’ s disease ( AD) with Vitamin D ( VD) 


supplementation has been studied widely, but the results in the literature are very conflicting. 


mer’ s Disease 
antioxidants-prevents-Alzheimer " conflicting 
s Disease ;oxidative stress-causes- 


Alzheimer’ s Disease 


VEGF gene-predisposes-Alzhei- conflicting 


mer’ s Disease 


EGb 761 -treats-Dementia controversially 


memantine-freatfs-Alzheimer ' s controversial 
Disease 
aluminum-predisposes- Alzhei- controversia 


mer’ s Disease 


Hydroxymethylglutaryl-CoA re- controversial 
ductase inhibitors-predisposes-de- 


mentia 


ethanol-predisposes dementia controversially 


supplementation-prevents- Alzhei- conflicting 


mer' s Disease 


= EARE 


mi 


3.6 不 确定 性 程度 较 低 的 矛盾 /冲突 知识 主张 跨 语 
句 识别 

在 去 除 3.3.1 中 识别 出 的 125 对 三 元 组 后 ,对 剩 
余 的 来 源 于 25 318 条 有 效 语句 的 42 650 对 三 元 组 进 
行 跨 语句 识别 。 根 据 2.3 中 所 设 定 的 规则 ,共计 识别 
出 87 组 表示 矛盾 /冲突 知识 主张 的 三 元 组 对 ,涵盖 807 
条 语句 。 因 笔者 主要 研究 阿尔 茨 海 默 病 (AD ) 相关 的 
诊断 和 治疗 知识 主张 ,对 于 普 适 性 的 主语 (如 diagno- 
sis ) 或 宾语 (如 patients , disease 、persons), 则 不 在 本 文 
的 研究 关注 范围 内 ,需要 去 除 。 此 外 ,标题 中 的 语句 多 
是 中 性 的 论述 (尤其 是 综述 类 文章 ) ,并 不 能 从 中 得 出 
结论 性 的 知识 主张 , 故 将 从 标题 中 抽取 得 来 的 部 分 三 
元 组 去 除 。 经 过 整理 ,最 终 得 到 64 组 与 AD 诊断 和 治 
疗 相 关 的 表示 矛盾 /冲突 知识 主张 的 三 元 组 对 ,涵盖 
490 条 语句 。 经 专家 判读 ,最 终 确定 36 组 .共计 259 对 


矛盾 /冲突 三 元 组 。 

根据 抽取 结果 ,可 将 与 阿尔 次 海 默 病 相关 的 三 元 
组 对 分 为 诊断 类 和 治疗 类 。 从 表 7 中 可 以 看 出 ,在 AD 
HJ12 I9r 77 TRI , 4x EY RR EE ( general anesthesia ) . 认 知 受 损 
(impaired cognition) ) ,神经 颗粒 素 (neurogranin ) , tau E 
F1 (tau proteins) Ej AD 的 病因 ,病理 或 发 病 机 制 密切 相 
关 , 但 相关 作用 机 制 仍 存在 较 大 争议 。 

国家 卫 健 委 2020 年 12 月 份 发 布 的 《精神 障碍 诊 
疗 规范 (2020 年 版 ) -阿尔 芯 海 默 病 》” 指 出 ,阿尔 芯 
海 默 病 的 病理 改变 以 老年 斑 ( Senile Plaques, SP) 、 神 经 
原 纤维 缠 结 ( Neurofibrillary Tangle , NFT) 和 神经 元 减少 
为 主要 特征 ,而 SP 的 中 心 是 B 淀粉 样 蛋 白 (B-amyloid 
protein, AB) ,AB 的 生成 和 清除 失衡 是 神经 元 变性 和 痴 
采 发 生 的 始 动 因素 ;NFT 的 主要 组 分 是 tau 蛋白 ,AB 
会 诱导 tau 蛋白 过 度 磷酸 化 ,炎症 反应 、 神 经 元 死亡 等 
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一 系列 病理 过 程 。 同 时 ,神经 递 质 异 党 (包括 乙酰 胆 碱 
系统 . 单 胶 系统 、 氮 基 酸 类 及 神经 肽 等 ) 也 是 阿尔 欧 海 
默 病 患 者 的 主要 症状 。 经 过 比 对 ,本 研究 识别 出 的 AD 
诊断 类 相关 的 矛盾 三 元 组 与 上 述 诊疗 规范 中 的 内 容 是 
基本 一 致 的 ,说 明 识 别 结果 较为 准确 ,可 以 作为 后 续 研 
究 改 进 的 参照 着 力 点 。 
R7 跨 语句 不 确定 性 程度 较 低 的 与 阿尔 荧 海 默 病 
相关 的 诊断 类 矛盾 三 元 组 对 


ce 
EE 
IEA 


序号 主语 谓词 ( 频次) 宾语 
1 general anesthesia predisposes ( 1) Alzheimer' s Disease 
neg predisposes( 1 ) 
2 impaired cognition predisposes ( 5 ) Alzheimer’ s Disease 
neg predisposes( 1 ) 
3 neurogranin predisposes (2) Alzheimer’ s Disease 
neg predisposes( 1 ) 
p- tau proteins treats(1) Alzheimer’ s Disease 


> predisposes ( 1) 
[CIE OER HI UR ALIUS 
根据 《精神 障碍 诊疗 规范 (2020 年 版 ) — IIR Zi 
PO) PAX AD 的 治疗 原则 和 常用 药物 内 容 , 可 将 有 
RS 跨 语句 不 确定 性 程度 较 低 的 与 阿 


wg 


| 


c 
尔 茨 


关 AD 的 治疗 方式 分 为 药物 治疗 和 非 药 物 干预 两 类 ， 
药物 治疗 主要 包括 :改善 认 知 的 药物 ,如 胆 碱 酯 酶 抑 
制剂 . 谷 氨 酸 受 体 持 抗 剂 (如 美金 刚 ) ;@ 针 对 精神 行 
为 症状 的 药物 ,如 抗 精神 病 药 、 抗 抑郁 药 、 心 境 稳定 剂 
等 。 非 药物 干预 主要 包括 环境 治疗 .感官 刺激 治疗 ` 行 
为 干预 音乐 治疗 .舒缓 治疗 . 香 氛 治疗 .认可 疗法 、 认 
知 刺激 治疗 等 多 种 形式 。 

与 4 精神 障碍 诊疗 规范 (2020 年 版 ) - 阿尔 茨 海 默 
病 》 对 应 ,笔者 将 识别 出 的 用 三 元 组 表示 的 AD 治疗 方 
式 分 为 药物 治疗 和 非 药 物 干 预 两 类 。 在 药物 治疗 方 邓 
( 见 表 8) ,兴奋 剂 (agonists) 、 抗 糖尿 病 药 (antidiabet- 
ics) 非 省 体 抗 炎 剂 (anti-inflammatory agents, non-ster- 
oidal) . 抗 氧 化 剂 ( antioxidants ) 阿司匹林 (aspirin ) , 5 
JMÉ BH Yr] (calcium channel blockers ) 、 胆 碱 酯 酶 抑制 
剂 (cholinesterase inhibitors ) , £ Æ IR 3f ( donepezil ) , X& 
基 甲 基 戊 二 酰 辅酶 A 还 原 酶 抑制 剂 ( Hydroxymethylglu- 
taryl-CoA reductase inhibitors ) 静脉 注射 免疫 球 和 蛋白 
(immunoglobulins ，intravenous ) .胰岛素 (insulin ) .胰岛 


海 默 病 相关 的 药物 治疗 类 矛盾 三 元 组 对 


[92 主语 谓词 (频次 ) 宾语 序号 主语 谓词 (频次 ) 宾语 
e agonists treats (3) Alzheimer' s Disease 14 insulin-like growth — prevents(1) Alzheimer' s Disease 
CN neg treats (1) factor I predisposes ( 1 ) 
Q agonists treats(2) impaired cognition 15 memantine treats( 1) agitation 
die neg treats (1) neg treats(2) 
> agonists treats(2) schizophrenia 16 memantine treats(23 ) Alzheimer' s Disease 
"— neg treats (1) neg treats( 1) 
X antidiabetics treats(2) Alzheimer' s Disease 17 memantine treats(6) dementia 
c neg treats (1) neg treats( 1) 
ETE S anti-inflammatory a- — treats(4) Alzheimer' s Disease 18 memantine treats( 1) lewy body disease 
C gents, non-steroidal neg treats(2) neg treats( 1) 
Q antioxidants treats(1) Alzheimer' s Disease 19 monastrol inhibits(1) long-term potentia- 
predisposes ( 1 ) neg inhibits( 1) tion 
T aspirin prevents( 1 ) Alzheimer' s Disease 20 pharmaceutical prep- — treats(48) Alzheimer’ s Disease 
neg treats (1) arations neg treats( 1) 
predisposes (3) 
8 calcium channel — treats(1) dementia 21 pharmaceutical prep- — neg disrupts(1) dementia 
blockers prevents ( 1) arations disrupts(1) 
predisposes ( 1 ) 
9 cholinesterase inhibi- ^ treats(25) Alzheimer’ s Disease 22 pharmaceutical prep- — treats(1) mild cognitive disor- 
tors neg treats (1) arations neg treats( 1) der 
10 donepezil stimulates(2.) acetylcholinesterase 23 proteins prevents ( 1) Alzheimer' s Disease 
inhibits (2) predisposes ( 1 ) 
11 Hydroxymethylglutar- — treats(9) Alzheimer' s Disease 24 testosterone treats 1) Alzheimer' s Disease 
yl-CoA reductase in- — prevents(2) predisposes ( 1 ) 
hibitors predisposes ( 1 ) 
12 immunoglobulins, in- — treats(2) Alzheimer' s Disease 25 vitamin D predisposes ( 1 ) Alzheimer’ s Disease 
travenous neg treats(1) neg. predisposes ( 1 ) 
13 insulin augments( 1) memory 26 vitamin E treats(2) Alzheimer’ s Disease 


disrupts(1) 


prevents(3) 


predisposes( 1 ) 
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素 样 生长 因子 I (insulin-like growth factor T) 、 美 金刚 
(memantine) 有丝分裂 驱动 蛋白 Eg5 抑制 剂 ( monas- 
trol) 蛋白质 (proteins) , 5& JL X ( testosterone ) .维他命 
D( vitamin D) 维他命 E( vitamin E) 等 在 治疗 AD 或 痴 
AR ,改善 认 知 和 精神 行为 症状 (如 抑郁 ) 的 作用 方面 仍 


存在 矛盾 或 争议 。 

在 非 药 物 干 预 方面 ( 见 表 9) ,体育 活动 ( physical 
activity) , 预防 性 治疗 (prophylactic treatment ) 等 方式 对 
AD 痴呆、 认 知 或 精神 行为 证 状 的 干预 治疗 作用 , 仍 存 
在 部 分 矛盾 或 争议 。 


RO 跨 语 句 不 确定 性 程度 较 低 的 与 阿尔 茨 海 默 病 相 关 的 非 药物 治疗 类 矛盾 三 元 组 对 


序号 主语 谓词 (频次 ) 宾语 序号 主语 谓词 (频次 ) 宾语 
1 physical activity treats(1) Alzheimer’ s Disease 4 therapeutic procedure — treats(10) dementia 
prevents (7 ) neg treats(4) 
predisposes (2 ) 
2 prophylactic treat- — treats(1) Alzheimer' s Disease 5 therapeutic procedure — treats(5) impaired cognition 
ment neg treats (1) neg treats( 1) 
3 therapeutic procedure — causes(1) Alzheimer' s Disease 6 therapeutic procedure 
treats (27 ) treats(2 ) m 
indifferent mood 
neg treats (1) neg treats ( 1) 
prevents ( 1 ) 
B Pr i Egas ZA 、 LER B po 
AF HE 为 研究 人 员 识 别 该 研究 领域 尚未 达成 一 致 共识 的 研究 
| 讨论 
S H 、 Zu 已 Ha me: X b 
tO 前 沿 提供 参考 ,帮助 研究 人 员 解 决 实际 问题 , 挖 气 潜 在 


AST 基于 三 元 组 的 矛盾 /冲突 知识 主张 识别 为 知识 发 
DE 
< 十 目前 ,学 术 文献 计量 研究 正经 历 着 从 聚焦 于 学 术 


2t E 到 重视 语义 特征 乃至 语 用 特征 的 转 
变 e9 。 基 于 引用 的 前 沿 识别 方法 ,通过 概念 共 现 展示 
欧普 间 的 关系 ,只 体现 出 相关 性 ,不 涉及 因果 性 质 。 例 
如 3 对 于 药物 和 疾病 的 共 现 ,不 能 从 中 判断 出 是 指 某 一 
执 慑 对 疾病 有 治疗 作用 还 是 诱发 不 良 反 应 事件 。 基 于 
三 蜂 组 的 知识 单元 识别 ,是 从 文献 计量 向 知识 计量 的 
m uu uu 
二 热点 或 研究 前 沿 识别 方法 ,可 以 体现 出 实体 间 是 
怎样 的 关系 ,以 及 “如 何 " 相 互 作 用 ,更 便于 研究 人 员 
准确 获取 实体 间 的 作用 机 制 ,有 针对 性 地 开展 后 续 研 
究 。 识 别 出 目 前 存在 的 具有 矛盾 /争议 的 知识 主张 ,可 


Z5] 


c 


prevents 


的 新 方法 .新 技术 、 新 知识 。 同 时 ,在 识别 矛盾 /冲突 知 
识 主张 的 过 程 中 ,通过 了 解 每 一 组 中 不 同 知识 主张 的 
提出 时 间 ( 见 图 4) ,可 以 大 致 了 解 某 一 研究 问题 随 着 
时 间 推 进而 逐步 演化 的 过 程 ,动态 了 解 矛 盾 / 争 议 知识 
主张 的 发 展 阶段 ,为 解决 问题 的 切入 点 提供 参照 。 以 
羟基 甲 基 戊 二 酰 辅酶 A 还 原 酶 抑制 剂 为 例 , 对 其 与 AD 
的 相互 作用 的 研究 演变 进行 展示 ,如 图 4 所 示 ( 为 便于 
展示 ,笔者 根据 谓词 所 代表 的 正 向 / 反 向 含义 及 不 确定 
性 程度 ,将 “prevents” 赋值 为 1,“treats” 赋值 为 2,“ pre- 
disposes” 赋值 为 — 1) ,2018 年 的 研究 针对 他 汀 类 药 
物产 基 甲 基 戊 二 酰 辅酶 A 还 原 酶 抑制 剂 与 AD 的 治疗 
或 预防 作用 提出 了 异议 ,指出 “真菌 衍生 的 他 汀 类 药物 
(fungus-derived statins) ”与 AD 风险 增加 有 关 , 为 深化 
他 汀 类 药物 与 AD 的 作用 机 制 提供 了 不 一 样 的 研究 结 
论 ,有 助 于 推动 现 有 研究 的 开展 。 


2012 2013 


论文 知识 主张 不 确定 性 程度 


8 2019 


论文 发 表 时 间 


—e— 谓词 


图 4 羟基 甲 基 戊 二 酰 辅酶 A 还 原 酶 抑制 剂 与 AD 的 相互 作用 研究 演变 过 程 
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4.2 ”知识 不 确定 性 程度 的 衡量 为 知识 图 谱 可 信和 度 计 
算 提供 参考 

本 研究 以 源 语句 中 是 否 含有 * may”“ could ” 
“ might” 等 表示 高 度 不 确定 性 的 提示 词 作为 划分 依据 ， 
将 处 理 后 的 源 语句 划分 为 不 确定 性 程度 较 高 的 语句 和 
不 确定 性 程度 较 低 的 语句 ,然后 分 别 进行 单 名 识别 和 
跨 语句 识别 , 据 此 抽取 出 的 具有 矛盾 /争议 的 三 元 组 的 
不 确定 性 程度 是 不 一 样 的 。 临 床 决策 过 程 充满 了 不 确 
定性 ,医生 的 决策 过 程 是 从 “知识 "到 “智慧 ”的 过 程 ， 
解决 的 是 “如 何在 不 确定 条 件 下 中 做 出 最 佳 决策 ”的 
问题 。 笔 者 在 表 7 至 表 9 的 跨 语句 识别 中 ,标注 出 了 
谓词 出 现 的 频次 ,可 以 计算 某 个 三 元 组 对 在 本 组 知识 
主张 中 出 现 的 频率 ,作为 量化 特定 三 元 组 不 确定 性 各 
魔 的 依据 ,也 为 支撑 临床 决策 的 知识 图 谱 的 构建 提供 
析 确 定性 程度 或 置信 度 参考 ,同时 完整 的 知识 单元 可 
为 知识 主张 提供 依据 来 源 。 据 此 ,在 构建 知识 图 谱 时 ， 
可 这 标注 出 三 元 组 中 主语 和 宾语 相互 作用 的 概率 ,为 


源 语句 


基于 知识 图 谱 的 临床 决策 提供 更 有 说 服 力 的 参考 。 
4.3 矛盾 /冲突 知识 主张 的 判定 离 不 开 专业 人 员 参 与 

笔者 以 不 确定 性 程度 高 低 为 划分 依据 ,分 别 进行 
了 矛盾 /冲突 知识 主张 的 识别 ,从 单 句 中 识别 出 15 组 
知识 主张 ,涉及 18 对 三 元 组 ;从 跨 语句 中 识别 出 67 组 
知识 主张 ,涉及 503 对 三 元 组 ,以 上 共计 521 对 三 元 
组 。 这 些 三 元 组 在 经 过 专家 判读 后 ,确定 372 对 三 元 
组 识别 准确 ,准确 率 为 71.4% ,去 掉 因 识别 错误 而 不 
能 构成 了 矛盾 /冲突 关系 的 三 元 组 ,最 终 得 到 49 组 (涵盖 
277 对 三 元 组 ) 矛盾 /冲突 知识 主张 。 经 过 分 析 ,该 方 
法 仍 存在 着 以 下 不 足 : 

(1) 三 元 组 的 识别 存在 着 错误 。 一 类 是 命名 实体 
识别 错误 ( 见 表 10 ) ,一 类 是 语义 关系 ( 即 谓词 ) 抽 取 错 
误 ( 见 表 11) 。 虽 然 SemRep 针对 不 同类 型 的 语义 关系 
的 识别 准确 率 范 围 为 59% - 96% 7" ,基本 能 满足 需 
要 ,但 仍 需要 专家 介入 对 识别 出 的 三 元 组 进行 人 工 判 
读 和 修正 。 


表 10 实体 识别 错误 举例 ( 以 triacetyluridine 为 例 ) 


三 元 组 


源 语句 


22086139. ab. 5 Transgenic rodent models over-expressing human -amyloid precursor protein (-APP) and mu- 
tant forms of tau have become precious tools to study and understand the pathogenesis of AD at the molecular, 


cellular and behavioural levels, and to test new therapeutic agents. 


triacetyluridine-causes-Alzhei- 


mer' s Disease 


BERE Ctriacetyluridine ,规范 名 称 为 2” ,3* ,5" -Tri-O-acetyluridine ) 英文 简称 TAU , semrep 错 将 tau ( 实 为 一 种 和 蛋白) 映射 为 了 ti- 


表 1 语义 关系 提取 错误 举例 (以 Hydroxymethylglutaryl-CoA reductase inhibitors 为 例 ) 


三 元 组 


al studies and an assessment of confounding. 


(2) 表 征 矛盾 /冲突 的 提示 词 和 识别 规则 需要 优 
化 。 尽 管 相 对 于 已 有 的 研究 ,笔者 扩展 了 表征 矛盾 / 冲 
突 的 提示 词 的 范围 (由 3 个 扩展 至 7 个 ) ,但 仍 待 补充 
和 优化 。 对 于 跨 语 句 的 识别 规则 ,有 学 者 列 出 了 表征 
矛盾 /冲突 的 谓词 对 ,也 有 学 者 将 谓词 划分 为 激励 类 
( excitatory ) 和 抑制 类 (inhibitory ) 两 个 相互 矛盾 /冲突 


23225700. ti. 1 Statins in the prevention of dementia and Alzheimer’ s disease; a meta-analysis of observation- 


Hydroxymethylglutaryl-CoA re- 
ductase inhibitors-prevents-Alzhe- 


imer' s Disease 


“ 往 :该 语句 是 中 性 论述 ,并 不 能 从 中 看 出 结论 性 的 知识 主张 ,因此 在 语义 关系 抽取 时 会 发 生 错 误 


5 结论 


学 科 领 域 研究 前 沿 代 表 着 各 个 学 科 领 域 的 难点 、 


年 ,国务 院 发 布 《国家 创新 驱动 发 展 战略 纲要 》'”, 指 
出 为 实现 2050 年 建成 世界 科技 创新 强国 的 宏伟 目标 ， 


的 群 组 。 第 一 种 方法 可 以 清晰 的 展现 识别 出 的 三 元 组 
的 因果 关系 ,但 受 限 于 识别 规则 的 数量 ,导致 识别 出 的 
知识 主张 数量 有 限 。 而 第 二 种 方法 则 便于 识别 出 更 多 
的 矛盾 /冲突 知识 主张 ,但 不 能 清晰 地 获取 三 元 组 中 的 
因果 关系 。 这 两 种 方法 各 有 利 浆 ,如 何 选取 应 根据 研 


要 “面向 科学 前 沿 加 强 原始 创新 ,力争 在 更 多 领域 引领 
世界 科学 研究 方向 “推进 变革 性 研究 ,在 新 思想 、 新 
发 现 . 新 知识 .新 原理 、 新 方法 上 积极 进取 ”。 在 当前 全 
球 许多 国家 将 创新 驱动 视 作 谋 求 苋 争 优势 的 核心 战略 
的 背景 下 ,识别 科学 研究 前 沿 .开展 变 草 性 研究 是 提升 
科学 前 沿 创新 能 力 、 启 得 发 展 主动 权 的 必要 手段 。 笔 
者 以 阿尔 次 海 默 病 为 例 , 根 据 不 确定 性 原理 中 的 基于 
矛盾 /冲突 检测 的 变革 性 研究 识别 方法 ,制定 表征 矛 
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ChinaXiv 合 作 期 刊 


. 图 书 情报 工作 ,2021 ,65(20) :123 - 134. 
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义 的 知识 主张 识别 规则 ,从 海量 医学 文本 中 
具有 矛盾 争议 的 临床 知 


AS 


识 主张 ,并 与 国家 卫生 健康 委员 会 颁布 的 《精神 障碍 诊 
疗 规范 (2020 年 版 ) - 阿尔 茨 海 默 病 》 中 指南 内 容 进行 


了 对 比 验证 ,最 


终结 果 


Z$ fH 


显示 ,识别 出 的 矛盾 /冲突 三 元 


组 的 主题 范围 与 指南 中 有 关 阿 尔 次 海 默 病 诊断 和 治疗 
的 内 容 基本 一 致 ,矛盾 /知识 主张 的 识别 结果 与 当前 研 
究 方向 高 度 契 合 。 该 实验 是 对 基于 矛盾 /冲突 的 不 确 
定 知 识 主 张 识别 的 一 次 验证 ,有 助 于 发 现 与 阿尔 茨 海 


默 病 研 究 相 关 的 尚 存 争议 的 潜在 研究 前 


沿 , 可 为 指导 


相关 研究 开展 提供 参考 。 未 来 笔者 将 进一步 向 不 确定 


性 


E 
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证 句 FER 


示 和 矛盾 /争议 的 提示 词 和 识别 规则 等 方向 扩展 该 方法 。 
本 致谢 感谢 感 妹 、 杨 洋 、 解 绮 去 、 秦 新 国 \ 尹 天 恒 在 研究 


过 程 中 给 予 的 宝贵 意见 和 建议 。 
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X Abstract: | Purpose/significance | Scientific research, especially medical research, is full of uncertainty. I- 
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CQ itying contradictory knowledge claims in research will help identify "scientific divergence/inconsistent scientific 
conclusions" , promote identification of potentially transformative scientific research and improve related research. 
| Method/process | Taking Alzheimer' s disease as an example, this article used SemRep to extract triples from the 
PubMed abstract data. Based on the knowledge claim identification rules that represented contradictory meanings, 
this article classified source sentences according to the degree of uncertainty and used single-sentence recognition and 
cross-sentence recognition respectively to identify contradictory medical research knowledge claims expressed in the 
form of triples. | Result/conclusion | A total of 49 groups (involving 277 pairs of triples) contradictory knowledge 
claims are identified from 6574 PubMed medical abstracts . There are still some controversies and contradictions in 
the diagnosis and treatment of Alzheimer' s disease, which need to be further verified. The identification of contradic- 
tory knowledge claims provides new ideas for the frontier discoveries of potentially transformative medical research , 
which can be used for knowledge discovery based on knowledge measurement and provide references for the reliability 
calculation of knowledge graph. 
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